SF 스타트업, 에어비앤비서 로봇 테스트하다 집을 엉망으로 만들어
테슬라와 크루즈 출신들이 설립한 샌프란시스코 로봇 스타트업 '봇 컴퍼니(The Bot Company)'가 가정용 로봇 프로토타입을 테스트하기 위해 에어비앤비 숙소를 사무실로 속이고 대여한 혐의를 받고 있습니다. 이 과정에서 여러 숙소의 가전제품, 가구 등이 파손되고 물건이 도난당하는 등 큰 피해를 입혀, 피해 호스트들이 손해배상을 위한 소송을 제기했습니다.
테슬라와 크루즈 출신들이 설립한 샌프란시스코 로봇 스타트업 '봇 컴퍼니(The Bot Company)'가 가정용 로봇 프로토타입을 테스트하기 위해 에어비앤비 숙소를 사무실로 속이고 대여한 혐의를 받고 있습니다. 이 과정에서 여러 숙소의 가전제품, 가구 등이 파손되고 물건이 도난당하는 등 큰 피해를 입혀, 피해 호스트들이 손해배상을 위한 소송을 제기했습니다.
테크크런치가 주최하는 벤처캐피탈·기술 컨퍼런스인 스트릭틀리VC(StrictlyVC) 로스앤젤레스 행사가 오는 6월 18일 열립니다. 이번 행사에서는 방산 기술 스타트업 Mach Industries의 창립자와 파운더스 펀드(Founders Fund) 투자자 등이 무대에 올라 국방, AI, 로봇 공학 등 미래 산업의 변화와 실제 배포 전략에 대해 깊이 있는 대화를 나눌 예정입니다. 업계 최고 수준의 투자자 및 창업가들과 소통하고 인사이트를 얻을 수 있는 핵심 네트워킹 자리입니다.
미국 실리콘밸리 스타트업 휴먼 아카이브(Human Archive)는 인도 배달 및 가사 서비스 노동자들에게 특수 카메라가 장착된 캡을 씌워 1인칭 관점의 일상 작업 영상 데이터를 수집합니다. 이렇게 확보한 데이터는 로봇 훈련용으로 쓰이며, 기존 영상뿐 아니라 촉각 장갑과 모션 캡처 슈트 등 다양한 맞춤형 하드웨어를 활용해 고품질 멀티 센서 데이터를 생산한다는 점에서 기술적 차별성을 갖습니다. 이 회사는 최근 820만 달러(약 110억 원)의 시드 자금을 유치하며, 실제 물리적 환경을 학습하려는 최첨단 AI 및 로봇 공학 연구소들의 데이터 갈증을 해소해 주는 중요한 역할을 주목받고 있습니다.
인공지능 로봇이 실생활 작업을 배울 수 있도록 돕는 '1인칭 데이터(egocentric data)' 수집이 새로운 긱 워크(gig work)로 부상하고 있습니다. 기자는 1주일간 스마트폰을 머리에 매달고 집안일을 촬영하며 로봇을 훈련시키는 경험을 했습니다. 인터넷에 무료 영상이 넘쳐나지만, 물을 엎지르지 않고 컵에 따르는 등 실제 로봇의 미세한 운동 능력 향상을 위해서는 고품질의 특수 데이터가 필수적이기 때문입니다.
샌프란시스코의 비영리단체 '프로젝트 오픈 핸드'는 의학적 맞춤 식사를 제공하기 위해 로봇 자원봉사자를 도입했습니다. 코로나19 팬데믹 이후 기업 자원봉사자가 크게 줄어 인력난을 겪으면서, 식재료 배치 작업을 돕는 AI 로봇을 구독 형태로 임대해 업무 효율을 높인 것입니다. 이는 비영리 단체에서도 혁신 기술을 적극 수용해 운영의 한계를 극복할 수 있음을 보여줍니다.
구글 I/O 2026 행사의 '다이얼로그(Dialogues)' 무대에서 산업 리더, 과학자, 창작자들이 모여 혁신 기술과 미래 사회를 논의했습니다. 선다르 피차이 CEO의 기조연설 후속 인터뷰를 시작으로 AI 에이전트(Agent), 양자 컴퓨팅, 로봇 공학, 영화 제작 등 다양한 분야에서 AI가 미치는 영향과 기술적 도약이 다뤄졌습니다.
AI 에이전트(OpenClaw)에 오픈소스 로봇 팔(LeRobot)을 연결해 물체 인식 및 파지, 모델 학습까지 수행하는 실험 결과입니다. 기존에는 로봇 제어·학습이 고도의 전문성을 요구했으나, 최신 코딩 에이전트가 자동 설정·캘리브레이션·스크립트 작성을 처리해 진입 장벽을 크게 낮춥니다. 연구진은 ‘코드를 정책(Code as Policy)으로’ 방식이 로봇 공학의 범용성과 신뢰성을 동시에 끌어올릴 차세대 패러다임이라고 평가합니다.
최근 발표된 리뷰 논문은 일상적인 비디오 데이터만으로 학습해 로봇이 행동의 결과를 미리 시뮬레이션할 수 있게 하는 '월드 액션 모델(WAMs)' 체계를 소개합니다. 기존 모델들이 단순히 카메라 이미지를 행동으로 매핑하는 데 그쳤다면, 이 모델들은 물리적 환경 변화를 예측하여 미지의 환경에서도 뛰어난 일반화 성능을 보여줍니다. 연구진은 백여 편의 관련 논문을 분석해 결과 예측과 행동 생성을 순차적 또는 동시에 수행하는 두 가지 핵심 아키텍처로 분류했습니다.
Reddit 사용자가 Wi-Fi나 셀룰러 연결 없이 엔비디아 젯슨 오린 NX와 소형 언어 모델인 Gemma 3 4B만으로 완전한 오프라인 로봇을 제작했습니다. 프롬프트 구조 최적화를 통해 캐시 적용 시 첫 토큰 생성 시간(TTFT)을 약 200ms로 단축하고 30개 이상의 센서 데이터를 실시간으로 자연어로 처리하는 점이 기술적으로 주목받습니다.
MIT 테크놀로지 리뷰는 AI가 어디에나 스며들었지만, 경제와 사회에 미칠 장기적 영향이 불확실한 현 시기를 ‘AI 전성기 이후의 기대감 하락(AI Malaise)’ 시대로 진단했습니다. 또한 체외수정(IVF)을 혁신할 AI와 로봇 기술의 부상, 시행착오와 데이터를 통해 실세계에 적응하는 로봇 학습의 패러다임 변화를 소개합니다. 끝으로 주요 경제 지표를 왜곡하는 AI, 엔비디아 칩 밀수 의혹, 저렴한 중국산 AI 모델의 위협 등 당장 체감해야 할 최신 기술 이슈들을 짚어줍니다.
본 기사는 체외수정(IVF) 기술의 현재 한계와 이를 극복하기 위한 최신 기술 동향을 다룹니다. 특히 착상 실패율을 낮추기 위해 개발 중인 자동화된 배아 주입 장치와, 향후 도입될 AI 및 로봇 기술이 시술의 성공률과 접근성을 어떻게 높일 수 있는지 설명합니다. 수정 및 착상의 복잡한 과정을 극복하려는 의료계의 혁신 시도를 통해 난임 치료의 패러다임이 바뀔 수 있음을 시사합니다.
로봇 공학을 위한 파운데이이션 AI(Foundational AI) 구축을 목표로 1억 500만 달러의 시드 투자를 유치한 제네시스 AI(Genesis AI)가 첫 모델과 자체 개발한 인간형 로봇 손을 공개했습니다. 이 회사는 '임바디먼트 갭(Embodiment Gap)'을 줄이기 위해 사람의 손과 동일한 크기와 형태의 로봇 손을 개발했으며, 작업자가 착용해 데이터를 수집하는 저렴하고 가벼운 센서 장갑도 함께 선보였습니다. 이러한 하드웨어와 소프트웨어의 풀스택(Full-stack) 결합은 실제 상용 환경에 적용할 수 있는 고품질 학습 데이터를 대량으로 확보할 수 있다는 점에서 업계에 중요한 의미를 갖습니다.
미국 해양대기청(NOAA)과 오르페우스 오션(Orpheus Ocean)은 심해 광물 탐사를 위해 '깊이를 저렴하게(deep for cheap)'라는 철학으로 개발된 저비용 자율수중차량(AUV) 2대를 태평양 심해에 투입했습니다. 이 잠수정들은 기존 장비의 10분의 1 수준인 수십만 달러의 저렴한 가격으로 심해 퇴적물 채취와 해저 '도약'이 가능하며, 정부 기관과 기업의 심해 탐사 접근성을 크게 높일 수 있습니다. 이번 탐사는 해저 코어 시추, 고해상도 이미지 촬영, 대규모 장기 작동 등을 통해 미개척 심해의 생태계와 핵심 광물 자원을 조사하는 데 목적이 있습니다.
MIT 스피너오프인 스타트업 Eka는 인간과 같은 자연스러운 손재주를 갖춘 로봇 팔을 선보였습니다. 이 로봇은 전구를 돌려 끼우거나 열쇠를 집어 드는 등 섬세한 작업을 수행하며, 로봇 분야의 마지막 난제 중 하나인 물리적 '손재주' 문제를 강화학습과 시뮬레이션을 통해 해결하고자 합니다.
소니 AI 연구진이 개발한 탁구 로봇 '에이스(Ace)'가 공식 규칙 하에 인간 고급 아마추어 및 프로 선수들과 경기를 치르며 승리를 거두는 기술적 이정표를 세웠습니다. 고속 센서, 실시간 의사결정 AI, 8관절 고속 로봇 팔을 결합하여 복잡하고 빠르게 변하는 실제 물리 환경에서 인간과 대등한 반응 속도와 제어력을 입증했습니다. 이 성과는 탁구를 넘어 예측 불가능한 실세계 환경에서 정확하고 빠르게 작동해야 하는 산업 전반의 실용적인 로봇 응용 분야를 여는 핵심 전기로 평가받습니다.
미국의 연구진들은 AI의 발전이 텍스트를 넘어 물리적 환경을 이해하는 '세계 모델(World Models)'로 확장되고 있으나, 정책 입안자들은 그 심각성을 인지하지 못하고 있다고 경고합니다. 차세대 로봇 공학과 자율주행 등 '물리적 AI'를 주도하기 위해서는 막대한 컴퓨팅 파워와 견고한 공급망이 필수적인데, 미국은 중국의 빠른 추격 속에 하드웨어 공급망 병목 현상과 국가 안보 및 사생활 침해 등 새로운 사회적 위험에 직면해 있습니다.
소니 AI가 개발한 탁구 로봇 '에이스(Ace)'가 공식 규칙 하에서 엘리트 및 프로 선수들을 상대로 승리하며 스포츠 분야 최초로 전문가 수준에 도달했습니다. 이 로봇은 9개의 카메라와 3개의 비전 시스템, 그리고 AI 제어 시스템을 활용하여 사람의 눈보다 빠르게 공과 스핀을 추적합니다. 이번 성과는 스포츠 로봇 공학의 한계를 넘어선 것으로, 향후 제조업 및 서비스 로봇 분야에도 핵심 기술이广泛应用될 수 있다는 점에서 중요합니다.
현재 AI는 디지털 영역을 정복했지만 물리적 세계를 이해하는 데는 한계가 있습니다. 이를 극복하기 위해 구글 딥마인드, 스탠퍼드 이비 리 교수, 얀 르쿤 등 AI 거장들이 물리적 환경을 시뮬레이션하고 예측하는 '세계 모델(World Model)' 연구에 본격적으로 나섰습니다. 세계 모델은 기존 대형 언어 모델(LLM)의 취약한 세계 인식 능력을 극복하고, 향후 로봇 공학과 자율 주행 등 물리적 환경 상호작용을 필요로 하는 AI 에이전트의 혁신을 이끌 핵심 기술로 평가받고 있습니다.
베이징에서 열린 제2회 휴머노이드 로봇 하프 마라톤 대회에서 중국 폰업체 Honor가 제작한 로봇이 약 50분 만에 완주하며 인간 세계 기록을 경신하는 놀라운 성과를 거두었습니다. 참가팀이 20개에서 100개 이상으로 급증했으며, 절반 가까운 로봇이 자율주행으로 코스를 완주해 하드웨어 및 기술적 성숙도가 크게 향상되었음을 보여주었습니다. 비록 달리기 속도가 당장 산업 현장의 복잡한 작업과 직결되지는 않지만, 구조 신뢰성과 냉각 기술 등 산업 전반에 적용될 수 있는 핵심 기술의 발전을 확인한 의미 있는 행사였습니다.
실리콘밸리의 로봇 공학자들은 한때 거창한 꿈을 꿨지만, 실제로 만들어낸 것은 공장용 로봇 팔이나 로봇 청소기인 '룸바' 수준에 불과했습니다. 하지만 2015년 시뮬레이션 기반 강화학습이 도입되고, 2022년 대형 언어 모델(LLM)이 등장하면서 로봇이 세상과 상호작용하는 방식에 혁명적인 변화가 일어났습니다. 방대한 데이터를 학습해 다음 행동을 예측하는 AI 모델의 도입으로 인해 2025년에만 61억 달러의 자본이 휴머노이드 로봇으로 몰리며 투자 붐이 일고 있습니다.
샌프란시스코 기반 로봇 스타트업 Physical Intelligence(PI)가 명시적으로 학습하지 않은 새로운 작업을 수행할 수 있는 로봇 파운데이션 모델 'π0.7(파이 제로 포인트 세븐)'을 발표했습니다. 이 모델은 서로 다른 맥락에서 학습한 기술을 결합하여 처음 보는 문제를 해결하는 '조합적 일반화(Compositional Generalization)' 능력을 보여주며, 이는 데이터 양 이상으로 성능이 비약적으로 상승하는 대규모 언어 모델(LLM)의 변곡점을 로봇 AI에서도 달성할 수 있음을 시사합니다. 아직 복잡한 다단계 작업의 자율 수행이나 프롬프트 엔지니어링의 중요성 등 해결해야 할 한계가 존재하지만, 추가 학습 없이도 사람의 언어 지시를 통해 실시간으로 로봇을 제어할 수 있게 되었다는 점에서 산업계에 큰 의미를 갖습니다.
로봇 개발자들을 위한 시뮬레이션 도구를 구축하는 스타트업 안티오크(Antioch)가 850만 달러(약 113억 원)의 시드 투자를 유치했습니다. 이 회사는 자율주행차와 같은 물리적 AI 에이전트를 가상 환경에서 훈련할 때 발생하는 '시뮬레이션-현실 간극(sim-to-real gap)'을 줄이는 솔루션을 제공합니다. 개발자들이 대규모 자본 없이도 AI 코딩 툴인 커서(Cursor)처럼 로봇을 가상으로 테스트하고 훈련시킬 수 있는 환경을 조성하는 것이 핵심입니다.
우크라이나의 젤렌스키 대통령은 지상 로봇과 드론으로만 적진을 장악하고 적군을 항복시킨 사례를 발표했습니다. 최근 3개월 동안 최전방에서 2만 2천 회의 로봇 작전이 수행되며 인명 피해를 크게 줄이는 등 무인 전투 시스템이 현대전의 핵심으로 자리 잡고 있습니다. 이러한 로봇 전술의 진화는 미국 등 세계 각국의 국방 기술 발전에도 중요한 영향을 미치고 있습니다.
구글이 로봇이 물리적 환경을 이해하고 작업을 수행할 수 있도록 돕는 핵심 모델인 Gemini Robotics-ER 1.6을 공개했습니다. 이번 버전은 다각도 카메라 이해를 바탕으로 한 공간 추론, 계기판 읽기 등의 기능이 대폭 향상되어 복잡한 산업 현장에서 로봇의 자율성을 크게 높였다는 점에서 중요합니다. 개발자들은 현재 Gemini API와 Google AI Studio를 통해 이 모델에 접근하고 활용할 수 있습니다.
중국의 유니트리 로보틱스(Unitree Robotics)가 저렴한 가격의 휴머노이드 로봇 'R1'을 글로벌 이커머스 플랫폼인 알리익스프레스를 통해 해외에 출시할 예정입니다. 이는 고가의 장비로 여겨지던 휴머노이드 로봇의 접근성을 대폭 낮추고, 일반 소비자와 연구자들도 쉽게 구매할 수 있는 '기술 민주화'의 중요한 이정표가 됩니다.
본 튜토리얼은 시각적 관찰을 바탕으로 공간적인 추론과 로봇 제어가 가능한 액션-추론 모델인 MolmoAct의 실전 구현 방법을 다룹니다. 환경 설정부터 다중 뷰 이미지 입력, 자연어 명령을 통한 깊이 추론 및 시각적 궤적 시각화, 실행 가능한 로봇 출력 생성까지 전체 워크플로우를 단계별로 안내합니다.
미국 기술 매체 MIT Technology Review의 오늘자 뉴스레터로, 이란의 해수담수화 시설 위협과 AI 기반 이커머스 소싱의 부상, 재택 근무 휴머노이드 로봇 학습 데이터 수집자들의 현황을 조명합니다. 또한 앤스로픽의 사이버 보안 모델, 구글 AI의 오답 문제, 일론 머스크와 오픈AI의 법적 분쟁 등 글로벌 기술 및 정책 이슈를 다루고 있습니다. AI가 기업 경영과 보안, 긱 워커 시장에 미치는 실질적인 변화를 빠르게 파악할 수 있는 주요 뉴스들입니다.
기존 AI 방식인 대규모 데이터 학습과 시행착오 대신, 인간처럼 논리적이고 추상적인 사고를 하는 '신경-기호적(Neuro-Symbolic) AI'가 등장했습니다. 로봇 공학 등 실제 물리적 환경에 적용되는 이 기술은 학습 및 작동에 필요한 에너지를 최대 100배 줄이면서도 정확도를 크게 높입니다. AI 산업의 막대한 전력 소비 문제를 해결할 게임 체인저로 평가받습니다.
중국의 대규모 로봇 훈련 랩 내부 모습을 보여주는 이미지가 공개되었습니다. 해당 시설에서 휴머노이드 로봇들이 실제로 활발하게 훈련을 진행하고 있으며, 기술의 발전으로 인해 이제는 단순히 영상 데이터(Video)를 활용하는 수준을 훌쩍 뛰어넘었다는 점이 강조되었습니다. 이는 로봇 공학 분야의 데이터 학습 및 자율 제어 기술이 얼마나 빠르게 고도화되고 있는지를 보여주는 중요한 징후입니다.